96 research outputs found

    Taking advantage of discursive properties for validating hierarchical semantic relations from parallel enumerative structures

    Get PDF
    This paper presents an approach for automatically validating candidate hierarchical relations extracted from parallel enumerative structures. It relies on the discursive properties of these structures and on the combination of resources of diéerent nature, a semantic network and a distributional resource. The results show an accuracy of between 0.50 and 0.67, with a gain of 0.11 when combining the two resources

    Elicitation de Structures Hiérarchiques à partir de Structures Enumératives pour la Construction d'Ontologie

    Get PDF
    International audienceUn texte est une suite de phrases dont la cohérence sémantique et rhétorique doit être assurée par des relations du discours. Un texte met aussi en oeuvre un ensemble de moyens typographiques, de ponctuations et d'agencements qui contribuent, eux aussi, à identifier son sens. Ces deux propriétés ont été respectivement formalisées, par différentes théories du discours, et par des modèles de structure de textes. Les correspondances entre les représentations des structures du discours et les mises en forme des textes ne sont pas généralement bijectives. Néanmoins, certaines structures discursives comme les structures énumératives ont des caractéristiques de typographie, de ponctuation ou/et de disposition qui (1) les rendent facilement repérables et (2) traduisent des relations hiérarchiques qui leur confèrent le statut d'indice de fragment d'ontologie. Dans cet article nous montrons comment les objets textuels ayant les propriétés (1) et (2) peuvent être exploités pour améliorer considérablement le processus d'enrichissement d'ontologies à partir de textes

    Ontology Building Using Parallel Enumerative Structures

    Get PDF
    National audienceThe semantics of a text is carried by both the natural language it contains and its layout. As ontology building processes have so far taken only plain text into consideration, our aim is to elicit its textual structure. We focus here on parallel enumerative structures because they bear implicit or explicit hierarchical relations, they have salient visual properties, and they are frequently found in corpora. We have defined a process which identifies them in a text, translates them into ontology structures and finally links such structures to the concepts of an existing ontology. We have assessed this process on Wikipedia encyclopaedic articles as they are rich in definitions and statements, and contain many enumerations. The many ontology structures we have obtained are thus used to enrich an ontology which we had automatically built from database specification documents

    Construction automatique d'ontologies à partir de spécifications de bases de données

    Get PDF
    National audienceLes méthodes classiques de construction automatiques d'ontologies à partir de textes exploitent le texte proprement dit. Nous étendons ces approches en prenant en compte la structure du texte, élément porteur d'information. Pour cela, nous nous basons sur des documents de spécifications de bases de données au format XML, pour lesquels le découpage structurel du texte correspond à une caractérisation sémantique de son contenu. L'idée est de tirer profit à la fois de la structure du texte et du texte rédigé. La méthode proposée consiste à utiliser la sémantique des balises et à caractériser leurs relations pour définir des règles de création de concepts et de relations sémantiques. Un noyau d'ontologie a été ainsi construit automatiquement à l'aide de ces règles, noyau ensuite enrichi par l'exploitation du texte en langage naturel à l'aide de patrons lexico-syntaxiques définis. Règles et patrons ont été implémentés sous Gate

    " Quand rédiger c'est décrire " : Mise en forme matérielle des textes et construction d'ontologies à partir de textes

    Get PDF
    National audienceLa construction d'ontologie à partir de textes met classiquement en oeuvre des outils issus du Traitement Automatique de la Langue et/ou des outils d'apprentissage supervisé ou non. Dans cet article nous revenons sur la possibilité d'exploiter des objets textuels à la fois facilement identifiables, souvent fertiles en connaissances ontologiques, et dont la sémantique peut clairement être explicitée par les théories du discours : les structures énumératives. Ici, nous ajoutons une nouvelle classe de relations sémantiques portée par les structures énumératives très présentes dans nos corpus : les relations lexicales telles que l'homonymie ou la synonymie. Ces relations semblent propices pour alimenter la facette terminologique d'une Ressource Termino-Ontologique. Nous montrons que ces relations peuvent être formellement caractérisées. Une évaluation de notre approche à partir d'un corpus annoté manuellement nous permet de valider notre position, ce qui constitue une première étape vers un outil d'apprentissage supervisé pour la construction d'ontologie à partir de texte

    Une typologie multi-dimensionnelle des structures énumératives pour l'identification des relations termino-ontologiques

    Get PDF
    International audienceCe travail s'inscrit dans le cadre de la construction de ressources termino-ontologiques. Il vise à améliorer l'extraction des relations sémantiques en exploitant les structures énumératives contenues dans les textes. Nous proposons ici une typologie multi-dimensionnelle de ces structures énumératives, selon les axes visuel, rhétorique, intentionnel et sémantique. Cette typologie intervient dans le cadre d'une campagne d'annotation outillée par LARAt (Logiciel d'Acquisition de Relations par l'Annotation de textes), pour l'identification de relations par apprentissage supervisé

    Correction d'ontologies construites Ă  partir de la structure de documents

    Get PDF
    National audienceLes logiciels de construction d'ontologies à partir de textes réalisent une interprétation fixée a priori du contenu des textes, qu'un expert du domaine ou une ontologie doit vérifier. Or une étude précise des limites des techniques d'analyse des textes permet de guider la correction de l'ontologie apprise en définissant des règles d'aide à la correction. Ces règles attirent l'attention de l'ontographe sur des parties d'ontologie contenant des « anomalies » et tiennent compte du texte d'origine et de l'analyse réalisée pour proposer des corrections. Dans cet article, nous illustrons la notion de règle de correction dans le cas où les connaissances apprises viennent de l'exploitation de structures énumératives parallèles présentes en corpus

    Construction d'ontologies à partir d'une collection de pages web structurées

    Get PDF
    MoanoDe nombreuses collections de documents disponibles sur le web décrivent les caractéristiques d'entités d'un même type (e.g. des produits, des plantes), chaque page présentant une de ces entités. Ces documents sont des sources de connaissances particulièrement adaptées pour la construction d'ontologies. Alors qu'ils partagent une même mise en forme régulière, ils contiennent moins de texte rédigé que des fichiers textes mais leur architecture est riche de sens. De ce fait, les méthodes linguistiques classiques pour identifier des concepts et des relations sont moins adaptées pour les analyser. Nous proposons une approche exploitant les diverses propriétés de ces documents, combinant analyse de la structure et de la mise en forme avec une analyse linguistique, et exploitant leur annotation sémantique

    Benefits of Natural Language Techniques in Ontology Evaluation : the OOPS! Case

    Get PDF
    National audienceNatural language techniques play an important role in Ontology Engineering. Developing ontologies in a manual fashion is a complex and time consuming process, which implies the participation of domain experts and ontology engineers to build and evaluate them. Natural language techniques traditionally help to (semi)automatically build ontologies and to populate them. However, the general trends for evaluating ontologies are mainly expert reviewing, evaluating quality dimensions and criteria, and evaluating against existing ontologies and set of common errors. That is, the use of natural language techniques in ontology evaluation is not widely spread. Thus, in this paper we aim at the use of natural language techniques during the ontology evaluation process. In particular, we propose a first attempt towards a language-based enhancement of the pitfall detection process within the ontology evaluation tool OOPS!
    • …
    corecore